Proje
Giriş
Bu çalışma, Türkiye’deki çeşitli demografik ve eğitim verilerini analiz etmeyi ve belirli göstergeler üzerinden tahminler yapmayı amaçlamaktadır. Proje kapsamında, “bolge”, “yil”, “cinsiyet”, “yas_grubu”, “egitim_duzey” ve “frekans” değişkenlerine sahip bir veri seti kullanılmıştır. Bu veriler, Türkiye’nin farklı bölgelerindeki nüfusun eğitim durumu ve demografik özellikleri hakkında bilgi sağlamaktadır.
Çalışmanın Amaçları
Veri Temizleme ve Hazırlık: İlk olarak, ham veri seti üzerinde gerekli temizleme ve düzenleme işlemleri gerçekleştirilmiştir. Bu adımda eksik verilerin doldurulması, gereksiz satır ve sütunların çıkarılması, verilerin uygun formatlara dönüştürülmesi gibi işlemler yapılmıştır.
Demografik Dağılım Analizleri: Türkiye’nin çeşitli bölgelerindeki nüfusun cinsiyet ve yaş grubu gibi demografik özelliklere göre dağılımları incelenmiştir. Bu analizler, bölgeler arasındaki farklılıkları ve benzerlikleri ortaya koymayı hedeflemiştir.
Eğitim Düzeyi Analizleri: Eğitim düzeylerine göre nüfusun dağılımı ve yıllar içerisindeki değişimleri analiz edilmiştir. Bu kapsamda, özellikle “Okuma Yazma Bilmeyen” nüfusun değişimi üzerine odaklanılmıştır.
2022 Yılı Tahminleri: Mevcut verilere dayanarak 2022 yılı için “Okuma Yazma Bilmeyen” nüfusun sayısı tahmin edilmiştir. Bu tahmin, son beş yıllık veriler kullanılarak yapılmıştır.
Kümeleme Analizi: Türkiye’nin çeşitli bölgelerinin eğitim düzeylerine göre benzerliklerini ve farklılıklarını belirlemek amacıyla kümeleme analizi gerçekleştirilmiştir. Bu analiz, bölgelerin eğitim düzeyleri açısından gruplandırılmasını sağlamıştır.
Yöntemler
Çalışma boyunca veri temizleme ve düzenleme işlemleri için çeşitli R paketleri kullanılmıştır. Ardından, verilerin analizi ve görselleştirilmesi için dplyr ve ggplot2 gibi paketlerden faydalanılmıştır. Özellikle lineer regresyon modeli, mevcut verilerden hareketle 2022 yılı için tahmin yapmada kullanılmıştır. Ki-kare testi, kadınlar ve erkekler arasında eğitim düzeyleri açısından anlamlı bir fark olup olmadığını incelemek için kullanılmıştır.
Veri
- Directory değiştirilmesi
- Gerekli paketleri yüklenmesi
library(data.table)
library(zoo)
library(readr)
library(tidyr)
library(dplyr)
library(readr)
library(reshape2)- Verinin yüklenmesi
- Verilerin doğru şekilde ayrılması
#veri <- read.csv("C:/Users/OlcmeOrtak/Downloads/pivot.csv",sep="|")
veri <- read_delim("pivot.csv", delim = "|")- Birinci, beşinci ve sonuncu satırın kaldırılması
- Satırların ve sütunların yerinin değiştirilmesi
- Üçüncü sütunun kaldırılması
- Matrisin data.table olarak değiştirilmesi
- Yıllardaki NA değerlerinin doldurulması
- Son satırın kaldırılması
- V2’nin kategorilere ayrılması
- Sütun isminin değiştirilmesi
- Sütun isminin eklenmesi
- İlk satırın kaldırılması
- “bolge” ve “frekans” sütunlarının eklenmesi
veri <- veri %>% pivot_longer(cols=c(`Akdeniz-TR6`,`Batı Anadolu-TR5`, `Batı Karadeniz-TR8`,
`Batı Marmara-TR2`, `Doğu Karadeniz-TR9`, `Doğu Marmara-TR4`, `Ege-TR3`,`Güneydoğu Anadolu-TRC`,`İstanbul-TR1`,
`Kuzeydoğu Anadolu-TRA`,`Orta Anadolu-TR7`,`Ortadoğu Anadolu-TRB`),names_to="bolge",values_to = "frekans")- Sütun pozisyonlarının değiştirilmesi
- Sıranın bölgelere göre alfabetik olarak değiştirilmesi
- Bazı değişkenlerin faktör olarak değiştirilmesi ve son kontrollerin yapılması
## [1] "Akdeniz-TR6" "Batı Anadolu-TR5" "Batı Karadeniz-TR8"
## [4] "Batı Marmara-TR2" "Doğu Karadeniz-TR9" "Doğu Marmara-TR4"
## [7] "Ege-TR3" "Güneydoğu Anadolu-TRC" "İstanbul-TR1"
## [10] "Kuzeydoğu Anadolu-TRA" "Orta Anadolu-TR7" "Ortadoğu Anadolu-TRB"
## [1] "Erkek" "Kadın"
## [1] "14-17" "18-21" "22-24" "25-29" "30-34" "35-39" "40-44" "45-49" "50-54"
## [10] "55-59" "6-13" "60-64" "65+"
## [1] "Bilinmeyen"
## [2] "Doktora"
## [3] "İlkokul"
## [4] "İlköğretim"
## [5] "Lise Ve Dengi Meslek Okulu"
## [6] "Okuma Yazma Bilen Fakat Bir Okul Bitirmeyen"
## [7] "Okuma Yazma Bilmeyen"
## [8] "Ortaokul Veya Dengi Meslek Ortaokul"
## [9] "Yüksek Lisans (5 Veya 6 Yıllık Fakülteler Dahil)"
## [10] "Yüksekokul Veya Fakülte"
## bolge yil cinsiyet yas_grubu
## Akdeniz-TR6 :1183 Length:14196 Erkek:7104 25-29 :1200
## Batı Anadolu-TR5 :1183 Class :character Kadın:7092 30-34 :1200
## Batı Karadeniz-TR8:1183 Mode :character 35-39 :1200
## Batı Marmara-TR2 :1183 40-44 :1200
## Doğu Karadeniz-TR9:1183 45-49 :1200
## Doğu Marmara-TR4 :1183 50-54 :1200
## (Other) :7098 (Other):6996
## egitim_duzey frekans
## Bilinmeyen :1560 Length:14196
## İlkokul :1560 Class :character
## Okuma Yazma Bilen Fakat Bir Okul Bitirmeyen:1560 Mode :character
## Okuma Yazma Bilmeyen :1560
## Ortaokul Veya Dengi Meslek Ortaokul :1560
## Lise Ve Dengi Meslek Okulu :1440
## (Other) :4956
- yil ve frekans’ın sayısala çevrilmesi
## bolge yil cinsiyet yas_grubu
## Akdeniz-TR6 :1183 Min. :2017 Erkek:7104 25-29 :1200
## Batı Anadolu-TR5 :1183 1st Qu.:2018 Kadın:7092 30-34 :1200
## Batı Karadeniz-TR8:1183 Median :2019 35-39 :1200
## Batı Marmara-TR2 :1183 Mean :2019 40-44 :1200
## Doğu Karadeniz-TR9:1183 3rd Qu.:2020 45-49 :1200
## Doğu Marmara-TR4 :1183 Max. :2021 50-54 :1200
## (Other) :7098 (Other):6996
## egitim_duzey frekans
## Bilinmeyen :1560 Min. : 1
## İlkokul :1560 1st Qu.: 1115
## Okuma Yazma Bilen Fakat Bir Okul Bitirmeyen:1560 Median : 6180
## Okuma Yazma Bilmeyen :1560 Mean : 26124
## Ortaokul Veya Dengi Meslek Ortaokul :1560 3rd Qu.: 29420
## Lise Ve Dengi Meslek Okulu :1440 Max. :461840
## (Other) :4956 NA's :33
## tibble [14,196 × 6] (S3: tbl_df/tbl/data.frame)
## $ bolge : Factor w/ 12 levels "Akdeniz-TR6",..: 1 1 1 1 1 1 1 1 1 1 ...
## $ yil : num [1:14196] 2017 2017 2017 2017 2017 ...
## $ cinsiyet : Factor w/ 2 levels "Erkek","Kadın": 1 1 1 1 1 1 1 1 1 1 ...
## $ yas_grubu : Factor w/ 13 levels "14-17","18-21",..: 1 1 1 1 1 1 1 2 2 2 ...
## $ egitim_duzey: Factor w/ 10 levels "Bilinmeyen","Doktora",..: 1 4 3 5 6 7 8 1 4 3 ...
## $ frekans : num [1:14196] 778 494 45364 1342 4032 ...
- Temiz verinin yüklenmesi
Türkiye’de Eğitim, Cinsiyet ve Bölgeler
Gerekli paketlerin yüklenmesi
Bölgelerdeki Cinsiyet Dağılımı
Yüzdelerin hesaplanması
bir <- veri %>%
group_by(bolge, cinsiyet) %>%
summarise(total_frekans = sum(frekans, na.rm = TRUE)) %>%
mutate(yuzde = total_frekans / sum(total_frekans) * 100) %>%
ungroup()Bar chart’ın oluşturulması
plot_ly(bir, x = ~bolge, y = ~yuzde, color = ~cinsiyet, colors = c('blue', 'red'),
type = 'bar', text = ~paste('Yüzde:', round(yuzde, 2)), textposition = 'auto',
marker = list(line = list(color = 'rgba(49,130,189,1.0)', width = 1))) %>%
layout(
title = list(text = "Bölgelere Göre Cinsiyetlerin Dağılımı"),
xaxis = list(title = "Bölge"),
yaxis = list(title = "Yüzde"),
barmode = 'group'
)Erkek ve kadın oranlarının her bölgede neredeyse eşit olduğu gözlemlenmektedir. Bu, cinsiyet dağılımının bölgeler arasında büyük farklılık göstermediğini ve her iki cinsiyetin de dengeli bir şekilde temsil edildiğini göstermektedir.
Bölgelerdeki Yaş Gruplarının Dağılımı
Yüzdelerin hesaplanması
iki <- veri %>%
group_by(bolge, yas_grubu) %>%
summarise(total_frekans = sum(frekans, na.rm = TRUE)) %>%
mutate(yuzde = total_frekans / sum(total_frekans) * 100) %>%
ungroup()Bar chart’ın oluşturulması
plot_ly(iki, x = ~bolge, y = ~yuzde, color = ~yas_grubu,
colors = c('blue', 'green', 'red', 'purple', 'orange', 'brown', 'pink'),
type = 'bar',
text = ~paste('Yüzde:', round(yuzde, 2)),
textposition = 'auto',
marker = list(line = list(color = 'rgba(49,130,189,1.0)', width = 1))) %>%
layout(title = "Bölgelere Göre Yaş Gruplarının Dağılımı",
xaxis = list(title = "Bölge", tickangle = -45),
yaxis = list(title = "Yüzde"),
barmode = 'dodge') Her yaş grubunun oranları farklı bölgelerde birbirine yakın görünmektedir. Özellikle genç yaş grupları (6-13 ve 14-17) ile yaşlı gruplar (65+) daha belirgin yüzdelere sahip olduğu görülmektedir. Bu dağılım, nüfusun demografik yapısının bölgeler arasında büyük farklılık göstermediğini göstermektedir.
Bölgelerdeki Eğitim Düzeylerinin Dağılımı
Yüzdelerin hesaplanması
uc <- veri %>%
group_by(bolge, egitim_duzey) %>%
summarise(total_frekans = sum(frekans, na.rm = TRUE)) %>%
mutate(yuzde = total_frekans / sum(total_frekans) * 100) %>%
ungroup()Bar chart’ın oluşturulması
plot_ly(uc, x = ~bolge, y = ~yuzde, color = ~egitim_duzey, type = 'bar',
text = ~paste('Yüzde:', round(yuzde, 2)), textposition = 'auto',
marker = list(line = list(color = 'rgba(49,130,189,1.0)', width = 1))) %>%
layout(title = "Bölgelere Göre Eğitim Düzeylerinin Dağılımı",
xaxis = list(title = "Bölge", tickangle = -45),
yaxis = list(title = "Yüzde"),
barmode = 'dodge')İlköğretim ve lise mezunlarının her bölgede en yüksek yüzdelere sahip olduğu görülmektedir. Diğer eğitim düzeyleri ise daha düşük oranlarda dağılmaktadır. Özellikle “Okuma Yazma Bilmeyen” kategorisi tüm bölgelerde düşük yüzdelere sahiptir. İstanbul ve Batı Marmara, yüksek eğitim düzeylerine sahip olduğu görülmektedir. Doğu ve Güneydoğu Anadolu bölgeleri ise daha düşük eğitim düzeylerine sahip oldukları görülmektedir.
Türkiye Çapında Yaş Gruplarının Yıllık Frekans Değişimleri
Verinin filtrelenmesi
yasdegisim <- veri %>%
group_by(yil, yas_grubu) %>%
summarise(total_frekans = sum(frekans), .groups = 'drop')Çizgi grafiğinin oluşturulması
p <- ggplot(yasdegisim, aes(x = yil, y = total_frekans, color = yas_grubu, group = yas_grubu, text = paste("Yaş Grubu: ", yas_grubu, "<br>Yıl: ", yil, "<br>Frekans: ", total_frekans))) +
geom_line(size = 1.2) +
geom_point(size = 3) +
labs(title = "Yaş Gruplarının Yıllık Frekans Değişimleri (2017-2021)",
x = "Yıl",
y = "Toplam Frekans",
color = "Yaş Grubu") +
theme_minimal() +
theme(
plot.title = element_text(size = 14, face = "bold"),
axis.title = element_text(size = 12),
axis.text = element_text(size = 10),
legend.title = element_text(size = 12),
legend.text = element_text(size = 10)
) +
scale_y_continuous(labels = scales::label_comma()) # Sayıları standart gösterim ile formatlama
# Plotly ile interaktif hale getirme
p_plotly <- ggplotly(p, tooltip = "text")
p_plotlyGenç yaş gruplarının (14-17 ve 18-21) frekanslarında belirgin bir artış gözlemlenmektedir. Türkiye’nin genel olarak genç bir nüfusa sahip olduğu ve bu genç nüfusun artmakta olduğu görülmektedir.
Türkiye Çapında Cinsiyetlere Göre Yaş Gruplarının Dağılımları
Yüzdelerin hesaplanması
dort <- veri %>%
group_by(cinsiyet, yas_grubu) %>%
summarise(total_frekans = sum(frekans, na.rm = TRUE)) %>%
mutate(yuzde = total_frekans / sum(total_frekans) * 100) %>%
ungroup()Bar grafiğinin oluşturulması
plot_ly(dort, x = ~yas_grubu, y = ~yuzde, color = ~cinsiyet, colors = c('blue', 'red'), type = 'bar',
text = ~paste('Yüzde:', round(yuzde, 2)), textposition = 'auto',
marker = list(line = list(color = 'rgba(49,130,189,1.0)', width = 1))) %>%
layout(title = "Cinsiyetlere Göre Yaş Gruplarının Dağılımı",
xaxis = list(title = "Yaş Grubu"),
yaxis = list(title = "Yüzde"),
barmode = 'dodge')Kadın ve erkek nüfusunun yaş gruplarına göre dağılımı büyük ölçüde dengeli, ancak bazı yaş gruplarında küçük farklılıklar gözlemlenmektedir. Özellikle 6-13 yaş grubunda kadın oranı daha yüksekken, 65+ yaş grubunda erkek oranı daha yüksek olduğu görülmektedir. Bu durum, genel olarak cinsiyetler arasında yaş gruplarının benzer şekilde dağıldığını, ancak belirli yaş gruplarında farklılıklar olabileceğini göstermektedir.
Türkiye Çapında Cinsiyetlere Göre Eğitim Düzeylerinin Dağılımları
Yüzdelerin hesaplanması
bes <- veri %>%
group_by(cinsiyet, egitim_duzey) %>%
summarise(total_frekans = sum(frekans, na.rm = TRUE)) %>%
mutate(yuzde = total_frekans / sum(total_frekans) * 100) %>%
ungroup()Pie chart’ın oluşturulması
plot_ly() %>%
add_pie(data = bes %>% filter(cinsiyet == "Kadın"),
labels = ~egitim_duzey, values = ~yuzde, name = "Kadın",
textinfo = 'none',
insidetextorientation = 'radial',
domain = list(row = 0, column = 0)) %>%
add_pie(data = bes %>% filter(cinsiyet == "Erkek"),
labels = ~egitim_duzey, values = ~yuzde, name = "Erkek",
textinfo = 'none',
insidetextorientation = 'radial',
domain = list(row = 0, column = 1)) %>%
layout(title = "Cinsiyetlere Göre Eğitim Düzeylerinin Dağılımı",
grid = list(rows = 1, columns = 2),
showlegend = TRUE,
annotations = list(
list(
text = "KADIN",
x = 0.2,
y = 0.1,
showarrow = FALSE,
xref = 'paper',
yref = 'paper',
font = list(size = 14, color = "black"),
align = 'center'
),
list(
text = "ERKEK",
x = 0.8,
y = 0.1,
showarrow = FALSE,
xref = 'paper',
yref = 'paper',
font = list(size = 14, color = "black"),
align = 'center'
)
))Her iki cinsiyette de ilkokul ve ilköğretim mezunlarının oranının oldukça yüksek olduğu görülmektedir. Erkeklerde, lise ve dengi meslek okulu mezunlarının oranının kadınlara göre biraz daha yüksek olduğu görülmektedir. Kadınlarda, okuma yazma bilmeyenlerin oranı erkeklere göre biraz daha yüksektir.
Yıllara Göre “Okuma Yazma Bilmeyen” Kadın ve Erkek Sayılarındaki değişim
Yüzdelerin hesaplanması
alti <- veri %>%
filter(egitim_duzey == "Okuma Yazma Bilmeyen") %>%
group_by(yil, cinsiyet) %>%
summarise(ortalama_sayi = mean(frekans, na.rm = TRUE)) %>%
ungroup()Bar grafiğinin oluşturulması
plot_ly(alti, x = ~yil, y = ~ortalama_sayi, color = ~cinsiyet, colors = c("Kadın" = "red", "Erkek" = "blue"), type = 'bar',
position = 'dodge') %>%
layout(title = "Yıllara Göre 'Okuma Yazma Bilmeyen' Kadın ve Erkek Sayıları",
xaxis = list(title = "Yıl"),
yaxis = list(title = "Ortalama Sayı"),
barmode = 'dodge',
legend = list(title = list(text = "Cinsiyet")))Grafikte, yıllar içinde kadınların okuma yazma bilmeyen oranının erkeklere göre çok daha yüksek olduğu görülmektedir. Bu durum, cinsiyetler arasındaki okuryazarlık farkını net bir şekilde ortaya koymaktadır. Ayrıca, yıllar içinde bu farkın azalmadığı da gözlemlenmektedir.
Türkiye Çapında Cinsiyetlere Göre “Okuma Yazma Bilen Fakat Bir Okul Bitirmeyen” Nüfusun Değişimi
Okuma yazma bilen fakat bir okul bitirmeyenlerin filtrelenmesi
2017-2021 yılları arasında cinsiyete göre yıllık frekansların toplanması
yedi1 <- yedi %>%
group_by(yil, cinsiyet) %>%
summarise(total_frekans = sum(frekans), .groups = 'drop')kadın ve erkeklerin toplamının hesaplanması
yedi_totals <- yedi1 %>%
group_by(yil) %>%
summarise(total_frekans = sum(total_frekans), .groups = 'drop')Çizgi grafiğinin oluşturulması
plot_ly() %>%
add_trace(data = yedi1 %>% filter(cinsiyet == "Kadın"),
x = ~yil, y = ~total_frekans,
type = 'scatter', mode = 'lines+markers',
line = list(color = 'red', width = 2),
marker = list(color = 'red'),
name = 'Kadın') %>%
add_trace(data = yedi1 %>% filter(cinsiyet == "Erkek"),
x = ~yil, y = ~total_frekans,
type = 'scatter', mode = 'lines+markers',
line = list(color = 'blue', width = 2),
marker = list(color = 'blue'),
name = 'Erkek') %>%
add_trace(data = yedi_totals,
x = ~yil, y = ~total_frekans,
type = 'scatter', mode = 'lines+markers',
line = list(color = 'green', width =2),
name = 'Toplam') %>%
layout(title = "Türkiye'de Cinsiyete Göre 'Okuma Yazma Bilen Fakat Bir Okul Bitirmeyen' Nüfusun Yıllara Göre Değişimi (2017-2021)",
xaxis = list(title = "Yıl"),
yaxis = list(title = "Frekans"),
legend = list(
title = list(text = "Kategoriler"),
x = 1.05, # Legend'ı sağa taşı
y = 1, # Legend'ı yukarı taşı
xanchor = 'left',
yanchor = 'top',
bgcolor = "rgba(255,255,255,0.5)",
bordercolor = "#FFFFFF",
borderwidth = 2
))Her iki cinsiyet için de okuma yazma bilen fakat bir okul bitirmeyen nüfus bu dönemde genel olarak azalmıştır. Azalma oranı erkeklerde kadınlardan daha düşüktür. 2017’den bu yana kadınların oranı yaklaşık % 6.5 düşerken erkeklerin oranı %2.5 düşmüştür.
Türkiye Çapında Doktoralılar İçerisinde Kadınlarının Oranının Değişimi
Kadın ve doktoralı oranının hesaplanması
sekiz <- veri %>%
filter(egitim_duzey == "Doktora") %>%
group_by(yil, cinsiyet) %>%
summarise(total_frekans = sum(frekans, na.rm = TRUE)) %>%
group_by(yil) %>%
mutate(total_doktora = sum(total_frekans)) %>%
ungroup() %>%
filter(cinsiyet == "Kadın") %>%
mutate(orani = total_frekans / total_doktora) %>%
select(yil, oranı = orani)Çizgi grafiğinin oluşturulması
plot_ly(sekiz, x = ~yil, y = ~oranı, type = 'scatter', mode = 'lines+markers',
line = list(color = 'red', width = 1.2),
marker = list(color = 'red', size = 6)) %>%
layout(title = list(text = "Türkiye Çapında Doktoralılar İçerisinde Kadınların Oranlarının Yıllar İçindeki Değişimleri",
font = list(size = 14, family = "Arial", color = "black")),
xaxis = list(title = "Yıl",
titlefont = list(size = 12),
tickfont = list(size = 10),
tickmode = 'array',
tickvals = unique(sekiz$yil)),
yaxis = list(title = "Kadın Doktoralı Oranı (%)",
titlefont = list(size = 12),
tickfont = list(size = 10),
tickformat = '.1%'),
plot_bgcolor = 'white',
paper_bgcolor = 'white')Türkiye çapında doktora programlarındaki kadınların oranının 2017’den 2021’e kadar istikrarlı bir şekilde arttığını görülmektedir. Artış oranı her yıl yaklaşık %0,25’tir. 2021 yılında doktora programlarındaki kadınların oranı %41,5’e ulaşarak son beş yılın en yüksek seviyesine çıkmıştır.
2017’den 2021’e Bölgelere Göre Erkek Doktoralı Oranlarındaki Değişim
Erkek ve doktoralıların filtrelenmesi
Toplam frekansın bulunması
Erkek ve doktoralı oranının hesaplanması
dokuz <- dokuz1 %>%
group_by(yil, bolge) %>%
summarise(erkek_doktorali_frekans = sum(frekans, na.rm = TRUE)) %>%
left_join(dokuz2, by = c("yil", "bolge")) %>%
mutate(erkek_doktorali_orani = erkek_doktorali_frekans / total_frekans * 100)Çizgi grafiğinin oluşturulması
plot_ly(data = dokuz, x = ~yil, y = ~erkek_doktorali_orani, color = ~bolge,
type = 'scatter',
line = list(width = 1.2),
marker = list(size = 6)) %>%
layout(title = "2017'den 2021'e Bölgeler Bazında Erkek Doktoralı Oranlarındaki Değişim",
xaxis = list(title = "Yıl"),
yaxis = list(title = "Erkek Doktoralı Oranı (%)", tickformat = ".2%"),
legend = list(title = list(text = "Bölge")),
plot_bgcolor = "white")2021 yılında erkek doktoralı oranı en yüksek olan bölge Batı Anadolu-TR5 iken, en düşük olan bölge ise Güneydoğu Anadolu-TRC’dir. 2017’den 2021’e kadar erkek doktoralı oranı en fazla artan bölge %2.03 ile Kuzeydoğu Anadolu-TRA olurken, en az artan bölge ise %0.52 ile Güneydoğu Anadolu-TRC’dir.
Türkiye Çapında Farklı Eğitim Düzeylerindeki Kadın ve Erkek Sayıları Arasındaki Anlamlı Farklılık
Eğitim düzeyi ve cinsiyete göre frekans tablosunun oluşturulması
Ki-kare testinin uygulanması
Beklenen frekansların görüntülenmesi
##
## Erkek Kadın
## Bilinmeyen 780.6593 779.3407
## Doktora 540.4565 539.5435
## İlkokul 780.6593 779.3407
## İlköğretim 678.5731 677.4269
## Lise Ve Dengi Meslek Okulu 720.6086 719.3914
## Okuma Yazma Bilen Fakat Bir Okul Bitirmeyen 780.6593 779.3407
## Okuma Yazma Bilmeyen 780.6593 779.3407
## Ortaokul Veya Dengi Meslek Ortaokul 780.6593 779.3407
## Yüksek Lisans (5 Veya 6 Yıllık Fakülteler Dahil) 600.5072 599.4928
## Yüksekokul Veya Fakülte 660.5579 659.4421
Beklenen frekansların her bir hücrede 5’ten büyük olup olmadığının kontrol edilmesi
## [1] FALSE
Ki-kare testi sonuçlarının görüntülenmesi
##
## Pearson's Chi-squared test
##
## data: on
## X-squared = 0.096051, df = 9, p-value = 1
p-değeri 0.05’ten büyük olduğu için (p = 1), hipotez testi sonuçlarına göre, kadınlar ve erkekler arasında eğitim düzeyleri açısından anlamlı bir fark olmadığı gözlemlenmektedir.
2022’de Türkiye’de “Okuma Yazma Bilmeyen” Nüfusun Sayısının Tahmini
Gerekli paketlerin yüklenmesi ve NA değerlerinin çıkarılması
## # A tibble: 14,163 × 6
## bolge yil cinsiyet yas_grubu egitim_duzey frekans
## <fct> <dbl> <fct> <fct> <fct> <dbl>
## 1 Akdeniz-TR6 2017 Erkek 14-17 Bilinmeyen 778
## 2 Akdeniz-TR6 2017 Erkek 14-17 İlköğretim 494
## 3 Akdeniz-TR6 2017 Erkek 14-17 İlkokul 45364
## 4 Akdeniz-TR6 2017 Erkek 14-17 Lise Ve Dengi Meslek Okulu 1342
## 5 Akdeniz-TR6 2017 Erkek 14-17 Okuma Yazma Bilen Fakat Bir Oku… 4032
## 6 Akdeniz-TR6 2017 Erkek 14-17 Okuma Yazma Bilmeyen 12
## 7 Akdeniz-TR6 2017 Erkek 14-17 Ortaokul Veya Dengi Meslek Orta… 290925
## 8 Akdeniz-TR6 2017 Erkek 18-21 Bilinmeyen 733
## 9 Akdeniz-TR6 2017 Erkek 18-21 İlköğretim 74938
## 10 Akdeniz-TR6 2017 Erkek 18-21 İlkokul 2421
## # ℹ 14,153 more rows
“Okuma Yazma Bilmeyen”in filtrelenmesi
Yıl bazında verilerin gruplanması ve toplam frekansın hesaplanması
library(dplyr)
onbir1 <- onbir %>%
group_by(yil) %>%
summarize(toplam_frekans = sum(frekans, na.rm = TRUE), .groups = 'drop')Eksik yılların belirlenmesi ve NA değerlerinin kontrol edilmesi
Lineer regresyon modelinin oluşturulması
2022 yılı için tahmin yapılması
Sonuçların yazdırılması
## [1] "2022 yılı için tahmin edilen 'Okuma Yazma Bilmeyen' nüfus: 1697865"
Çizgi grafiğinin oluşturulması
plot_ly(data = onbir1, x = ~yil, y = ~toplam_frekans, type = 'scatter', mode = 'lines+markers',
line = list(color = 'blue'), marker = list(color = 'blue', size = 6), showlegend = FALSE) %>%
add_lines() %>%
add_markers() %>%
add_lines(x = c(2021, 2022),
y = c(onbir1 %>% filter(yil == 2021) %>% pull(toplam_frekans),
round(tahmin)),
line = list(color = 'red', width = 2, dash = 'solid'), showlegend = FALSE) %>%
add_annotations(
x = 2022, y = round(tahmin),
text = paste('Tahmin:', round(tahmin)),
showarrow = TRUE,
arrowhead = 2,
ax = 0, ay = -40
) %>%
layout(
title = "Yıllık 'Okuma Yazma Bilmeyen' Nüfus Tahmini",
xaxis = list(title = "Yıl"),
yaxis = list(title = "Toplam Frekans"),
font = list(size = 12)
)2017-2021 yılları arasında “Okuma Yazma Bilmeyen” nüfusun sürekli olarak azaldığını görülmektedir. 2017 yılında yaklaşık 2.200.000 olan bu nüfus, 2021 yılına gelindiğinde 1.900.000’in altına düşmüştür. Son beş yılın azalma oranı %20.3’tür. 2022 yılı için yapılan tahmin ise bu azalma trendinin devam edeceğini ve okuma yazma bilmeyen nüfusun yaklaşık 1.697.865 seviyesine gerileyeceğini öngörmektedir. 2021’den 2022’ye tahmini azalma oranı da %8.84’tür.
Bölgelere Göre Tüm Eğitim Düzeylerindeki Nüfusun Kümelenmesi
Gerekli paketlerin yüklenmesi
Önce frekansa göre bir dendrogram oluşturulması ve verinin düzenlenmesi
Verinin bölge ve eğitim düzeyine göre özetlenmesi
oniki <- dcast(veri_temiz, bolge ~ egitim_duzey, value.var = "frekans", fun.aggregate = sum, fill = 0)Mesafe matrisini oluştururken Öklidyen mesafe kullanılması. Eğitim düzeyleri arasındaki farkları değerlendirmek için uygun bir metriktir, çünkü her bir değişkenin (eğitim düzeyinin) aritmetik farklarını dikkate alır.
Hiyerarşik kümeleme
Dendogram oluşturulması
Dendogramın çizilmesi
# X eksenindeki etiketleri bölge adları ile değiştirme
labels <- oniki$bolge
dend <- dend %>% set("labels", labels)
# Dendrogramı ggplot2 ile çizme
dend_plot <- ggdendrogram(dend, rotate = TRUE, size = 1) +
labs(title = "Bölgelere Göre Eğitim Düzeyleri Kümeleme Dendrogramı",
x = "Bölgeler",
y = "Mesafe") +
theme_minimal()
print(dend_plot)Bu dendrogram, bölgelerin eğitim düzeylerine göre hiyerarşik olarak kümelendiğini göstermektedir. Eğitim düzeylerinin benzer olduğu bölgeler aynı kümede yer almaktadır. Daha kısa mesafeler, kümelerin birbirine daha benzer olduğunu, daha uzun mesafeler ise daha farklı olduğunu gösterir. Ortadoğu Anadolu ve Orta Anadolu bölgelerinin yakın olması, bu bölgelerin eğitim düzeylerinin benzer olduğunu göstermektedir. Ege ve Güneydoğu Anadolu bölgeleri, diğerlerinden belirgin şekilde farklı olduğu için, bu bölgelerde farklı eğitim startejileri gerekebilir.
Frekans yerine her bölgenin kendi içindeki eğitim düzeyi oranları kullanılmıştır. Frekans değerlerini doğrudan kullanmak, bölgeler arasında doğal olarak var olan büyüklük farklarını yansıtmaktadır. Örneğin, nüfusu daha büyük olan bölgeler doğal olarak daha yüksek frekans değerlerine sahip olacaktır. Bu, dendrogramın öncelikli olarak nüfus büyüklüklerine göre kümelenmesine neden olabilir. Oranlar kullanıldığında, her bölgenin içindeki dağılım standartlaştırılır. Bu, bölgeler arası karşılaştırmayı kolaylaştırır çünkü her bölgedeki eğitim düzeylerinin nispi dağılımını dikkate alınır. Bölgeleri kendi içinde oranlayarak dendrogram oluşturmak, bölgeler arası kıyaslamaların daha adil, anlamlı ve dengeli olmasını sağlar.
Verinin bölge ve eğitim düzeyine göre özetlenmesi
oniki1 <- dcast(veri_temiz, bolge ~ egitim_duzey, value.var = "frekans", fun.aggregate = sum, fill = 0)Her bölgenin kendi içinde oranlanması
Her bölgenin toplam kişi sayısının hesaplanması
Her bölgedeki eğitim düzeylerinin yüzdelerinin hesaplanması
oniki_ratios <- oniki_ratios %>%
mutate(across(starts_with("Doktora"):`Yüksekokul Veya Fakülte`, ~ . / toplam * 100))Veri çerçevesinin uzun formata dönüştürülmesi
egitim_duzey_long <- oniki_ratios %>%
pivot_longer(cols = starts_with("Doktora"):`Yüksekokul Veya Fakülte`, names_to = "egitim_duzey", values_to = "yuzde")Grafiğin oluşturulması
fig <- plot_ly(egitim_duzey_long, x = ~bolge, y = ~yuzde, color = ~egitim_duzey, type = 'bar', text = ~paste0(round(yuzde, 2), '%'),
hoverinfo = 'text', colors = "Set3") %>%
layout(barmode = 'stack',
title = 'Bölgelerin Eğitim Düzeylerine Göre Yüzdelik Dağılımı',
xaxis = list(title = 'Bölgeler', tickangle = -45),
yaxis = list(title = 'Yüzde', tickformat = '.2f'),
legend = list(title = list(text = 'Eğitim Düzeyi')),
margin = list(b = 100))
figİstanbul’da yüksek lisans ve doktora oranlarının oldukça yüksek olduğu görülmektedir. Eğitim seviyesi genellikle yüksektir. Orta Anadolu-TR7 ve Ortadoğu Anadolu-TRB bölgelerinde ortaokul ve ilkokul seviyelerinin yüksek olduğu görülmektedir, okuma yazma bilen fakat bir okul bitirmeyenlerin oranları da yüksektir. Lisans ve üzeri eğitim seviyeleri her iki bölgede de nispeten daha düşüktür. Doğu Karadeniz-TR9 ve Batı Marmara-TR2 bölgelerinde ortaokul, lise ve doktora oranları birbirlerine yakındır. Güneydoğu Anadolu-TRC ve Ege-TR3 bölgeleri ilk ve ortaokul seviyelerindeki benzer oranlar ile düşük lise eğitim seviyeleriyle birbirine benzer eğitim düzeyi profili göstermektedir. Akdeniz-TR6 ve Batı Karadeniz-TR8 bölgeleri de benzer ilkokul ve ortaokul eğitim seviyelerindedirler. Her iki bölgede de düşük doktora oranları gözlemlenmektedir.
Gerekli paketlerin yüklenmesi
Her bölgenin toplam kişi sayısının hesaplanması
Her bölgedeki eğitim düzeylerinin yüzdelerinin hesaplanması
oniki_ratios <- oniki_ratios %>%
mutate(across(starts_with("Doktora"):`Yüksekokul Veya Fakülte`, ~ . / toplam * 100))Veri çerçevesinin uzun formata dönüştürülmesi
egitim_duzey_long <- oniki_ratios %>%
pivot_longer(cols = starts_with("Doktora"):`Yüksekokul Veya Fakülte`, names_to = "egitim_duzey", values_to = "yuzde")Dendrogram için mesafe matrisi oluşturulması (Öklidyen mesafe kullanarak)
Hiyerarşik kümeleme
Dendrogram oluşturulması
Dendrogramın görselleştirilmesi
Dendrogramı ggplot2 ile çizme
dend_plot <- ggdendrogram(dend, rotate = TRUE, size = 1) +
labs(title = "Bölgelere Göre Eğitim Düzeyleri Kümeleme Dendrogramı (Oran)",
x = "Bölgeler",
y = "Mesafe") +
theme_minimal()
print(dend_plot)Yakın bölgelerden biri olan Ortadoğu Anadolu-TRB ve Orta Anadolu-TR7, eğitim seviyesi açısından ağırlıklı olarak ilköğretim seviyesinde yoğunlaşmakta ve okuma yazma bilen fakat bir okul bitirmeyen grupların yüksek olması nedeniyle benzer profiller sergilemektedirler. Diğer yakın bölgeler olan Doğu Karadeniz-TR9 ve Batı Marmara-TR2, lise ve yükseköğretim düzeylerinde benzer oranlara sahip olup, bu eğitim seviyeleri bakımından paralel bir eğitim profili sergilemektedirler. Bir diğer yakın bölgeler olan Güneydoğu Anadolu-TRC ve Ege-TR3 bölgeleri, ilk ve ortaokul seviyelerindeki benzer oranlar ile düşük lise ve üzeri eğitim seviyeleri nedeniyle birbirlerine yakın profiller çizmektedir. Akdeniz-TR6 ve Batı Karadeniz-TR8 bölgeleri nispeten yakın mesafelerde konumlanmıştır. Her iki bölge de ilkokul ve ortaokul eğitim seviyelerinde yoğunlaşmaktadır. Akdeniz-TR6 ve İstanbul-TR1 bölgeleri dendrogramda en uzak mesafede konumlanmışlardır. İstanbul yüksek öğrenim düzeyiyle öne çıkarken, Akdeniz lise ve daha düşük seviyelerde yoğunlaşmaktadır. Kuzeydoğu Anadolu-TRA ve Batı Anadolu-TR5 bölgeleri de uzak mesafede yer almaktadır. Kuzeydoğu Anadolu’nun okuma yazma oranlarının düşük ve temel eğitim seviyelerinde yoğunlaşmışken, Batı Anadolu’nun daha yüksek eğitim seviyelerinde yoğunlaşmaktadır.
Sonuç
Sonuç ve Değerlendirme
Cinsiyet Dağılımı ve Demografik Eşitlik: Cinsiyet dağılımının her bölgede dengeli olduğu gözlemi, toplumsal cinsiyet eşitliği açısından olumlu bir gösterge olarak değerlendirilebilir. Ancak, bu denge sağlanmış olmasına rağmen, yaş gruplarında belirgin farklılıklar gözlemlenmiştir. Bu, genç ve yaşlı nüfusun belirgin oranlarının, eğitim ve sağlık hizmetlerine erişim gibi konularda bölgesel farklılıkların dikkate alınması gerektiğini işaret eder. Özellikle genç yaş grubundaki artış, eğitim politikalarının ve gençlik destek programlarının güçlendirilmesi gerektiğini öne sürmektedir.
Eğitim Düzeyleri ve Bölgesel Farklılıklar: Eğitim düzeylerinde gözlemlenen yüksek oranlar, genel olarak eğitim düzeyinin bölgesel farklılıklara rağmen homojen olduğunu gösterir. Ancak, eğitim düzeylerinin bölgesel farklılıkları, bazı bölgelerde eğitimin kalitesini ve erişimini artırmaya yönelik ek önlemler gerektirdiğini göstermektedir. İstanbul’da yüksek lisans ve doktora oranlarının oldukça yüksek olduğu görülmektedir. Eğitim seviyesi genellikle yüksektir. Orta Anadolu-TR7 ve Ortadoğu Anadolu-TRB bölgelerinde ortaokul ve ilkokul seviyelerinin yüksek olduğu görülmektedir, okuma yazma bilen fakat bir okul bitirmeyenlerin oranları da yüksektir. Lisans ve üzeri eğitim seviyeleri her iki bölgede de nispeten daha düşüktür. Doğu Karadeniz-TR9 ve Batı Marmara-TR2 bölgelerinde ortaokul, lise ve doktora oranları birbirlerine yakındır. Güneydoğu Anadolu-TRC ve Ege-TR3 bölgeleri ilk ve ortaokul seviyelerindeki benzer oranlar ile düşük lise eğitim seviyeleriyle birbirine benzer eğitim düzeyi profili göstermektedir. Akdeniz-TR6 ve Batı Karadeniz-TR8 bölgeleri de benzer ilkokul ve ortaokul eğitim seviyelerindedirler. Her iki bölgede de düşük doktora oranları gözlemlenmektedir.
Kadın ve Erkek Eğitim Farklılıkları: Kadınların okuma yazma bilmeyen oranının erkeklere göre daha yüksek olması, cinsiyetler arasındaki eğitim eşitsizliğini vurgular. Bu durum, kadınlara yönelik eğitim ve okuryazarlık destek programlarının artırılmasını gerektirir. Ayrıca, yıllar içinde bu farkın azalması gerektiğini belirten politikaların etkili olduğunu gösterebilir; ancak bu trendin sürdürülebilirliğini sağlamak için devam eden çabalar gerekmektedir.
Doktora Programlarındaki Cinsiyet Dağılımı: Doktora programlarındaki kadın oranının artışı, cinsiyet eşitliğinin sağlanmasına yönelik olumlu bir gelişmedir. Ancak, bazı bölgelerde erkeklerin oranlarındaki artışlar daha belirgin olup, bu durum cinsiyetler arası fırsat eşitliğini sağlamak için daha fazla teşvik ve destek sağlanması gerektiğini gösterir. Batı Anadolu ve Güneydoğu Anadolu bölgeleri arasındaki farklar, bölgesel eğitim fırsatlarının eşitlenmesi için özel stratejiler geliştirilmesi gerektiğini ortaya koymaktadır.
Okuma Yazma Bilmeyen Nüfusun Azalması: “Okuma Yazma Bilmeyen” nüfusun azalması, eğitim politikalarının etkili olduğunu gösterse de, okuryazarlık seviyesinin daha da iyileştirilmesi için sürdürülebilir stratejilerin oluşturulması gerektiğini vurgular. Eğitim reformları ve okuryazarlık kampanyaları, bu trendin devamını desteklemek için genişletilmelidir.
Öneriler
Eğitim Programlarının Özelleştirilmesi: Eğitim stratejileri, bölgesel ve cinsiyete dayalı farklılıkları dikkate alarak özelleştirilmelidir. Özellikle düşük eğitim düzeylerine sahip bölgelerde yoğunlaştırılmış eğitim programları ve destek hizmetleri sağlanmalıdır. Doğu Karadeniz-TR9 ve Batı Marmara-TR2 bölgelerinde lise ve yükseköğretim seviyelerinin artırılması, Güneydoğu Anadolu-TRC ve Ege-TR3 bölgelerinde ise ilkokul ve ortaokul seviyelerine yönelik stratejiler geliştirilmelidir.
Kadın ve Genç Nüfusa Yönelik Destekler: Kadınların ve gençlerin eğitim ve okuryazarlık seviyelerinin artırılması için özel destek programları ve teşvikler geliştirilmelidir. Kadınların okuma yazma bilmeyen oranlarının yüksekliği, bu alanda ek çabaların gerekliliğini vurgular. Genç nüfusun eğitim ihtiyaçları da göz önünde bulundurularak gençlik destek programları güçlendirilmelidir.
Okuryazarlık Programlarının Genişletilmesi: Okuma yazma bilmeyen nüfusun azalmasını destekleyen okuryazarlık programlarının güçlendirilmesi ve genişletilmesi önemlidir. Özellikle az gelişmiş bölgelerde, Ortadoğu Anadolu-TRB ve Orta Anadolu-TR7 bölgelerinde okuma yazma bilmeyen oranlarının yüksek olması nedeniyle bu programların daha etkili olması sağlanmalıdır. Eğitim reformları, okuma yazma oranlarının iyileştirilmesine yönelik stratejiler içermelidir.
Bölgesel Eğitim Düzeylerinin Artırılması: İstanbul gibi yüksek eğitim düzeyine sahip bölgelerde, yüksek lisans ve doktora programlarının desteklenmesi gerekmektedir. Orta Anadolu-TR7 ve Ortadoğu Anadolu-TRB bölgelerinde ise ilkokul ve ortaokul seviyelerinin artırılmasına yönelik politikalar geliştirilmelidir. Bu bölgelerde eğitim politikalarının bu ihtiyaçlara göre uyarlanması önemlidir.
Eğitim Stratejilerinin Kişiselleştirilmesi: Eğitim stratejileri, benzer eğitim profillerine sahip bölgelerde özelleştirilmelidir. Doğu Karadeniz-TR9 ve Batı Marmara-TR2 bölgelerinde lise ve yükseköğretim seviyelerinin güçlendirilmesine yönelik programlar; Güneydoğu Anadolu-TRC ve Ege-TR3 bölgelerinde ise ilkokul ve ortaokul seviyelerine odaklanılması gerekmektedir.
Bölgesel Eğitim Profillerinin Derinleştirilmesi: Akdeniz-TR6 ve Batı Karadeniz-TR8 bölgelerinde ilkokul ve ortaokul eğitim seviyelerinin artırılması için özel stratejiler geliştirilmelidir. Kuzeydoğu Anadolu-TRA ve Batı Anadolu-TR5 bölgelerindeki eğitim farklılıkları dikkate alınarak her bölgeye özgü eğitim politikaları ve destek programları oluşturulmalıdır.
Eğitim Yatırımlarının Artırılması: İstanbul ile diğer bölgeler arasındaki yüksek eğitim düzeyi farklılıkları, eğitim yatırımlarının bölgesel farklılıkları göz önünde bulundurarak artırılmasını gerektirir. Eğitim bütçeleri ve kaynaklar, yüksek öğrenim seviyelerindeki eşitsizlikleri azaltmak ve tüm bölgelerde eğitim fırsatlarını eşitlemek için yeniden yapılandırılmalıdır.